The next sexy job
The ability to take data to be able to understand it, to process it, to extract value from it, to visualize it, to communicate it, that’s going to be a hugely important skill.
– Hal Varian, Google
Data science, as it’s practiced, is a blend of Red-Bull-fueled hacking and espresso-inspired statistics.
Data science is the civil engineering of data. Its acolytes possess a practical knowledge of tools & materials, coupled with a theoretical understanding of what’s possible
– Mike Driscoll, CEO of metamarkets
A data scientist is someone who can obtain, scrub, explore, model and interpret data, blending hacking, statistics and machine learning. Data scientists not only are adept at working with data, but appreciate data itself as a first-class product.
– Hilary Mason, chief scientist at bit.ly
Parler de la donnée, c’est aussi évoquer le datascientist, ce mouton à 5 pattes de la data disposant de compétences statistiques, informatiques, comprenant parfaitement les enjeux métier de l’entreprise… Est-il aussi un fantasme du discours ambiant sur le big data ?
S’il peut exister des profils qui s’approchent de cette description, la réalité démontre le plus souvent que la datascience, comme la science en générale, ne se produit pas seule mais en groupe. La bonne question à se poser est donc plutôt celle de la synchronisation des différentes compétences au sein de l’organisation. Nous plaidons davantage pour un datascientism que pour des datascientists.
Une autre réalité méconnue sur le datascientist est qu’il s’agit avant tout d’un métier d’artisan. Chaque problème et chaque jeu de données demande toujours une démarche spécifique qui n’est pas industrialisable, ce que beaucoup de gens ne comprennent pas encore.
Récupérer, mélanger, enrichir, filtrer, nettoyer, vérifier, formater, transformer des données…
Arbre de décision, régression, clustering, Modèle graphique, SVM…
Graphiques, Data visualisation, Cartes…
Récupérer, mélanger, enrichir, filtrer, nettoyer, vérifier, formater, transformer des données…
Arbre de décision, régression, clustering, Modèle graphique, SVM…
Graphiques, Data visualisation, Cartes…
Récupérer, mélanger, enrichir, filtrer, nettoyer, vérifier, formater, transformer des données
Analyse de données traditionnelle
Graphiques, Data visualisation, Cartes…